20 research outputs found

    The linguistic-computacional modeling of metonymy in the framenetbrasil lexical database: a case study

    Get PDF
    This work reports on ongoing research aimed at modeling a metonymic relationship in the FrameNet Brasil database. This paper is based on a case study with the Teams frame. Both the frame and the corpus consulted are part of a frame-based trilingual (Portuguese -- Spanish -- English) electronic dictionary covering the soccer, tourism and World Cup domains developed by FrameNet Brasil. Thebasic infrastructure, analytical categories and methodology used were those developed for FrameNet (Fillmore et al. 2003, Baker et al. 2003, Ruppenhofer et al. 2010), which can be defined as anapplication of Frame Semantics to practical lexicography

    Modelagem de construções de pretérito imperfeito

    Get PDF
    Este trabajo tiene como objetivo presentar la descripción y el modelado de construcciones de Pretérito Imperfecto en portugués brasileño (PT-Br) y español (ES) para contribuir al desarrollo de un sistema de traducción por máquina que utiliza la base de datos enriquecida de FrameNet Brasil (FN -Br) para mejorar el resultado de los sistemas de traducción por máquina. Primero, se realizó un análisis bibliográfico de las construcciones de Pretérito Imperfecto en PT-Br y en ES. Posteriormente, para certificar las ocurrencias de esa construcción, se constituyó un corpus con ocurrencias de Pretérito Imperfecto en PT-Br y en ES compuesto por datos tomados de cuentos (en lengua meta y versión traducida) de Machado de Assis y García Marques. Según los datos, se notó que había casos de discrepancia entre los usos del Imperfecto. Luego, los contextos de discrepancia fueron analizados entre las traducciones de PT-Br a ES y de ES a PT-Br. El análisis indicó que el Constructicon de la FN-Br, en los moldes actuales, no admite construcciones morfológicas. De esta manera, se propuso la inclusión de un recurso en el Constructicon para almacenar los modelos lingüístico computacionales, en forma de construcciones morfológicas. Para eso, se pretende incorporar restricciones de modo, aspecto y tiempo verbal aplicadas a construcciones del tipo Pretérito Imperfecto.Este trabalho visa apresentar a descrição e a modelagem de construções de Pretérito Imperfeito em Português Brasileiro (PT-Br) e em Espanhol (ES) de modo a contribuir para o desenvolvimento de um sistema de tradução por máquina que utiliza a base de dados enriquecida da FrameNet Brasil (FN-Br) para melhorar o resultado de sistemas de tradução por máquina. Primeiramente, fizemos o levantamento bibliográfico das construções de Pretérito Imperfeito em PT-Br e em ES. Posteriormente, para atestar as ocorrências dessa construção, constituímos um corpus com ocorrências de Pretérito Imperfeito em PT-Br e em ES composto por dados retirados de contos (em língua alvo e versão traduzida) de Machado de Assis e García Marques. Com base nos dados, notamos que havia ocorrências de discrepância entre usos do Imperfeito. Logo, passamos à análise dos contextos de discrepância entre as traduções do PT-Br para ES e do ES para PT-Br. A análise indicou que o Constructicon da FN-Br, nos moldes atuais, não comporta construções morfológicas. Dessa forma, propomos a inclusão de um recurso no Constructicon para armazenar modelos linguístico-computacionais na forma de construções morfológicas. Para tanto, pretendemos incorporar restrições de modo, aspecto e tempo verbal aplicadas a construções do tipo Pretérito Imperfeito

    Inheritance relations between constructions and between frames: challenges to the extension of the constructionist approach to the computational domain in FrameNet Brasil

    Get PDF
    This paper aims to discuss to what extent analytical practices that are already a milestone in Cognitive Linguistics can be extended to the realm of Computational Linguistics. Specifically, we aim to investigate whether inheritance relations between constructions - a pairing of a form evoking a frame - which are computationally represented in a Constructicon, may parallel frame-to-frame relations in the FrameNet Brasil database.Este trabalho tem por objetivo discutir em que medida práticas analíticas já consagradas pela Linguística Cognitiva podem ser estendidas ao domínio da Linguística Computacional. Em específico, buscamos investigar se as relações de herança entre construções - pareamentos de uma forma evocadora de um frame - modeladas computacionalmente em um Constructicon, podem ser postas em paralelo com aquelas relações estabelecidas entre os frames na base de dados da FrameNet Brasil

    BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

    Full text link
    Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License

    The Construction Network Reconfiguration Hypothesis

    No full text

    Usage-based models in linguistics: an interview with Joan Bybee

    Get PDF
    In this special issue of Linguística, a number of linguistic analyses are presented to the reader. Despite focusing on different phenomena in different languages, all of them share a common analytical approach: the usage-based one. In this electronic interview, Joan Bybee, distinguished professor at the University of New Mexico and one of the most prominent researchers on Usage-Based Linguistics, discusses the foundations of usage-based models, the arguments in favor of adopting them and their relation to other theories of language, mainly Cognitive Linguistics and Construction Grammar.</p

    A Gramaticalização das Construções Modalizadoras Herdeiras do Dativo com Infinitivo: evidências em favor da necessidade de empreender análises históricas nos estudos orientados pela perspectiva da Gramaticalização

    No full text
    Neste artigo, propõe-se a hipótese da dupla origem para a construção de Dativo com Infinitivo (DCI). Sugere-se que tal construção teria se originado de duas construções distintas do Latim, quais sejam, a de cláusula de finalidade e a do datiuus auctoris, as quais, devido a uma coincidência formal, mesclam-se de forma oportunista em uma única construção, cujo esquema sintático é para x infinitivo

    Diretrizes para a criação de um recurso lexical multilíngue a partir da semântica de frames: a experiência turística em foco

    No full text
    O artigo destaca diretrizes utilizadas para o desenvolvimento do Copa 2014 FrameNet Brasil, dicionário eletrônico multilíngue, Português, Inglês, Espanhol, para os domínios da Copa, do Futebol e do Turismo. Utilizando uma teoria linguística que enfatiza a estreita relação entre sistema linguístico e experiência humana, possibilitada através de corpus, a Semântica de Frames investe, com o termo frame, em modelagens de experiências e eventos humanos que possibilitam atribuir sentidos às palavras. A rede semântica, FrameNet, em constante desenvolvimento para a língua inglesa no International Computer Science Institute, em Berkeley, em processo de extensão para outras línguas em diversos países como o Brasil, fornece a metodologia necessária para a ampliação deste recurso. O produto desenvolvido a partir deste aporte teórico-metodológico, disponível online gratuitamente, é aqui apresentado através do domínio turístico

    FRAMES COMO INTERLÍNGUA NA ESTRUTURAÇÃO DE DICIONÁRIOS ELETRÔNICOS MULTILÍNGUES DE DOMÍNIOS ESPECIALIZADOS

    No full text
    A proposta deste trabalho é apresentar a potencialidade de frames, constructos mentais que organizam o conhecimento, como interlíngua para o alinhamento de bancos de dados lexicais de dicionários eletrônicos multilíngues de domínios especializados (GAMONAL, 2013). Essa proposta está sendo explorada pelo projeto Copa 2014 FrameNet Brasil (SALOMÃO ET AL, 2011), no desenvolvimento de um dicionário eletrônico trilíngue – Português, Inglês, Espanhol – estruturado em frames para os domínios da Copa do Mundo, do Futebol e do Turismo
    corecore